智能论文笔记

Optimal high-dimensional and nonparametric distributed testing under communication constraints

Botond Szabó , Lasse Vuursteen , Harry van Zanten

分类： (统计)机器学习

2022-02-02

我们在分布式框架中得出最小值测试错误，其中数据被分成多个机器，并且它们与中央机器的通信仅限于$ b $位。我们研究了高斯白噪声下的$ d $ - 和无限维信号检测问题。我们还得出达到理论下限的分布式测试算法。我们的结果表明，分布式测试受到从根本上不同的现象，这些现象在分布式估计中未观察到。在我们的发现中，我们表明，可以访问共享随机性的测试协议在某些制度中的性能比不进行的测试协议可以更好地表现。我们还观察到，即使仅使用单个本地计算机上可用的信息，一致的非参数分布式测试始终是可能的，即使只有$ 1 $的通信和相应的测试优于最佳本地测试。此外，我们还得出了自适应非参数分布测试策略和相应的理论下限。

translated by 谷歌翻译

SD-LayerNet: Semi-supervised retinal layer segmentation in OCT using disentangled representation with anatomical priors

Botond Fazekas , Guilherme Aresta , Dmitrii Lachinov , Sophie Riedl , Julia Mai , Ursula Schmidt-Erfurth , Hrvoje Bogunovic

分类：计算机视觉

2022-07-01

光学相干断层扫描（OCT）是一种非侵入性的3D模态，广泛用于视网膜的眼科。在OCT上实现自动化的解剖学视网膜层分割对于检测和监测不同视网膜疾病（如年龄相关的黄斑病（AMD）或糖尿病性视网膜病）很重要。但是，大多数最先进的层分割方法基于纯监督的深度学习，需要大量的像素级注释数据，这些数据昂贵且难以获得。考虑到这一点，我们将半监督的范式介绍到视网膜层分割任务中，该任务利用大规模未标记数据集中存在的信息以及解剖学先验。特别是，一种新型的完全可区分的方法用于将表面位置回归转换为像素结构化分割，从而使以耦合方式同时使用1D表面和2D层表示来训练模型。特别是，这些2D分割被用作解剖因素，与学习的样式因子一起组成了用于重建输入图像的分离表示。同时，我们建议一组解剖学先验，以改善有限的标记数据时，可以改善网络训练。我们在使用中间和湿amd的现实世界中的扫描数据集上证明了我们的方法在使用我们的完整训练集时优于最先进带有标记数据的一部分。

translated by 谷歌翻译

Discussion of `Multiscale Fisher's Independence Test for Multivariate Dependence'

Antonin Schrab , Wittawat Jitkrittum , Zoltán Szabó , Dino Sejdinovic , Arthur Gretton

分类：机器学习 | (统计)机器学习

2022-06-22

我们讨论了多尺度Fisher对Gorsky和MA（2022）提出的多变量依赖的独立性测试，与基于Hilbert-Schmidt独立标准（HSIC）的现有线性时间内核测试相比。我们强调了这样一个事实，即在任何有限样本量的内核测试水平都可以得到准确控制，就像多率级别一样。在我们的实验中，我们观察到测试能力方面的一些性能限制。

translated by 谷歌翻译

Local distance preserving auto-encoders using Continuous k-Nearest Neighbours graphs

Nutan Chen , Patrick van der Smagt , Botond Cseke

分类：机器学习

2022-06-13

保留数据中相似性的自动编码器模型是表示学习中的流行工具。在本文中，我们介绍了几种自动编码器模型，这些模型在从数据空间到潜在空间的映射时可以保留本地距离。我们使用局部距离保留损失，该损失基于连续的K-Nearthiend邻居图，该图已知可以同时捕获所有尺度的拓扑特征。为了提高培训绩效，我们将学习作为约束优化问题，并保存本地距离，作为主要目标和重建精度作为约束。我们将这种方法推广到分层变分自动编码器，从而学习具有几何一致的潜在和数据空间的生成模型。我们的方法在几个标准数据集和评估指标上提供了最先进的性能。

translated by 谷歌翻译

HuSpaCy: an industrial-strength Hungarian natural language processing toolkit

György Orosz , Zsolt Szántó , Péter Berkecz , Gergő Szabó , Richárd Farkas

分类：自然语言处理 | (统计)机器学习

2022-01-06

虽然有几种可用于匈牙利语的源语言处理管道，但它们都不满足当今NLP应用程序的要求。语言处理管道应由接近最先进的lemmatization，形态学分析，实体识别和单词嵌入。工业文本处理应用程序必须满足非功能性的软件质量要求，更重要的是，支持多种语言的框架越来越受青睐。本文介绍了哈普西，匈牙利匈牙利语言处理管道。呈现的工具为最重要的基本语言分析任务提供组件。它是开源，可在许可证下提供。我们的系统建立在Spacy的NLP组件之上，这意味着它快速，具有丰富的NLP应用程序和扩展生态系统，具有广泛的文档和众所周知的API。除了底层模型的概述外，我们还对共同的基准数据集呈现严格的评估。我们的实验证实，母鹿在所有子组织中具有高精度，同时保持资源有效的预测能力。

translated by 谷歌翻译

NetKet 3: Machine Learning Toolbox for Many-Body Quantum Systems

Filippo Vicentini , Damian Hofmann , Attila Szabó , Dian Wu , Christopher Roth , Clemens Giuliani , Gabriel Pescia , Jannes Nys , Vladimir Vargas-Calderon , Nikita Astrakhantsev

分类：机器学习

2021-12-20

我们介绍了Netket的版本3，机器学习工具箱适用于许多身体量子物理学。Netket围绕神经网络量子状态构建，并为其评估和优化提供有效的算法。这个新版本是基于JAX的顶部，一个用于Python编程语言的可差分编程和加速的线性代数框架。最重要的新功能是使用机器学习框架的简明符号来定义纯Python代码中的任意神经网络ANS \“凝固的可能性，这允许立即编译以及渐变的隐式生成自动化。Netket 3还带来了GPU和TPU加速器的支持，对离散对称组的高级支持，块以缩放多程度的自由度，Quantum动态应用程序的驱动程序，以及改进的模块化，允许用户仅使用部分工具箱是他们自己代码的基础。

translated by 谷歌翻译

Learning to Deblur and Rotate Motion-Blurred Faces

Givi Meishvili , Attila Szabó , Simon Jenni , Paolo Favaro

分类：计算机视觉 | 人工智能

2021-12-14

我们提出了一种解决从脸部单个运动模糊图像的新观点渲染夏普视频的新颖任务。我们的方法通过隐式地通过三个大型数据集的联合训练来处理面部的几何和运动来处理面部模糊的复杂性：FFHQ和300VW，我们构建的新伯尔尼多视图DataSet（BMFD）。前两个数据集提供了各种各样的面，并允许我们的模型更好地概括。 BMFD允许我们引入多视图约束，这对于从新的相机视图综合夏普视频至关重要。它由来自多个主题的多种视图的高帧速率同步视频组成，这些拍摄对象的多个观点显示了广泛的面部表情。我们使用高帧率视频通过平均来模拟现实运动模糊。感谢此数据集，我们训练一个神经网络，从单个图像和相应的面凝视中重建3D视频表示。然后，我们将相对于估计的凝视和模糊图像提供相机视点，作为对编码器解码器网络的输入，以生成具有新颖的相机视点的锐框的视频。我们在我们的多视图数据集和Vidtimit的测试对象上展示了我们的方法。

translated by 谷歌翻译

Analyzing hierarchical multi-view MRI data with StaPLR: An application to Alzheimer's disease classification

Wouter van Loon , Frank de Vos , Marjolein Fokkema , Botond Szabo , Marisa Koini , Reinhold Schmidt , Mark de Rooij

分类：机器学习 | (统计)机器学习

2021-08-12

多视图数据是指特征被分成特征集的设置，例如因为它们对应于不同的源。堆叠惩罚的逻辑回归（Staplr）是最近引入的方法，可用于分类并自动选择对预测最重要的视图。我们将此方法的扩展引入到数据具有分层多视图结构的位置。我们还为STAPLR介绍了一个新的视图重要性措施，这使我们能够比较层次结构的任何级别的视图的重要性。我们将扩展的STAPLR算法应用于Alzheimer的疾病分类，其中来自三种扫描类型的不同MRI措施：结构MRI，扩散加权MRI和休息状态FMRI。Staplr可以识别哪种扫描类型以及MRI措施对于分类最重要，并且在分类性能方面优于弹性净回归。

translated by 谷歌翻译

Constrained Probabilistic Movement Primitives for Robot Trajectory Adaptation

Felix Frank , Alexandros Paraschos , Patrick van der Smagt , Botond Cseke

分类：机器人

2021-01-29

将机器人放置在受控条件外，需要多功能的运动表示，使机器人能够学习新任务并使其适应环境变化。在工作区中引入障碍或额外机器人的位置，由于故障或运动范围限制导致的关节范围的修改是典型的案例，适应能力在安全地执行机器人任务的关键作用。已经提出了代表适应性运动技能的概率动态（PROMP），其被建模为轨迹的高斯分布。这些都是在分析讲道的，可以从少数演示中学习。然而，原始PROMP制定和随后的方法都仅为特定运动适应问题提供解决方案，例如障碍避免，以及普遍的，统一的适应概率方法缺失。在本文中，我们开发了一种用于调整PROMP的通用概率框架。我们统一以前的适应技术，例如，各种类型的避避，通过一个框架，互相避免，在一个框架中，并将它们结合起来解决复杂的机器人问题。另外，我们推导了新颖的适应技术，例如时间上未结合的通量和互相避免。我们制定适应作为约束优化问题，在那里我们最小化适应的分布与原始原始的分布之间的kullback-leibler发散，而我们限制了与不希望的轨迹相关的概率质量为低电平。我们展示了我们在双机器人手臂设置中的模拟平面机器人武器和7-DOF法兰卡 - Emika机器人的若干适应问题的方法。

translated by 谷歌翻译

f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization

Sebastian Nowozin , Botond Cseke , Ryota Tomioka

分类：

2016-06-02

Generative neural samplers are probabilistic models that implement sampling using feedforward neural networks: they take a random input vector and produce a sample from a probability distribution defined by the network weights. These models are expressive and allow efficient computation of samples and derivatives, but cannot be used for computing likelihoods or for marginalization. The generativeadversarial training method allows to train such models through the use of an auxiliary discriminative neural network. We show that the generative-adversarial approach is a special case of an existing more general variational divergence estimation approach. We show that any f -divergence can be used for training generative neural samplers. We discuss the benefits of various choices of divergence functions on training complexity and the quality of the obtained generative models.

translated by 谷歌翻译